Programación para las Ciencias Sociales (ICP0506)

AndrƩs Cruz



2019-08-05 L - Primera clase



Links primera clase: tiny.cc/curso-r-uc

ƍndice

  1. Introducción: ¿por qué hacer código en ciencias sociales?

  2. Aspectos formales

  3. RStudio Cloud

  4. Encuesta de cierre

¿Por qué hacer código en ciencias sociales?

Interfaz grÔfica (PSPP) vs código (R en RStudio). Elaboración propia.

Interfaz grÔfica (PSPP) vs código (R en RStudio). Elaboración propia.

A. Flexibilidad y capacidad (I)

Fuente: [NBC News](https://www.nbcnews.com/news/us-news/san-francisco-uses-tech-clear-more-8-000-pot-cases-n975866)

Fuente: NBC News

A. Flexibilidad y capacidad (II)

  • Las herramientas que veremos en este curso son de código abierto (software libre).
  • Cualquier persona puede tomar cualquier herramienta, ver su código y adaptarlo como mejor le parezca y necesite.
  • Resultados de esta comunidad de software libre:

A. Flexibilidad y capacidad (III)

Fuente: [`@leonugo`, 2018](https://twitter.com/leonugo/status/1014298553500479489)

Fuente: @leonugo, 2018

B. Trayectorias tecnológicas (I)

InterƩs en Google para diferentes programas de estadƭstica/econometrƭa en LatinoamƩrica, 2004-2018. Fuente: Urdinez & Cruz (sin publicar).

InterƩs en Google para diferentes programas de estadƭstica/econometrƭa en LatinoamƩrica, 2004-2018. Fuente: Urdinez & Cruz (sin publicar).

B. Trayectorias tecnológicas (II)

Fuente: [Agarwal (2018)](https://onlinelibrary.wiley.com/doi/10.1111/puar.12979)

Fuente: Agarwal (2018)

C. Reproducibilidad (I)

  • Gracias al código:
    • Podemos repetir nuestros anĆ”lisis todas las veces que queramos, con las modificaciones que queramos.
    • Podemos automatizar procesos tediosos.
    • Podemos compartir la totalidad de nuestro flujo de trabajo con colegas.
    • Podemos buscar ayuda con facilidad: nuestro código es igual de transparente que el de los/as demĆ”s, y los mensajes de error estĆ”n estandarizados.

C. Reproducibilidad (II) - Ciencia social reproducible

ā€œLa Ćŗnica forma de comprender y evaluar un anĆ”lisis empĆ­rico en su totalidad es conociendo el proceso exacto por el cual se generaron los datos y se realizó el anĆ”lisisā€ (King, 1995).

  • La existencia de código es crucial para la replicación de un anĆ”lisis empĆ­rico cuantitativo.
  • El código incluso ayuda a declarar diseƱos de investigación antes de que estos se realicen, como es la premisa del nuevo proyecto DeclareDesign.

Aspectos formales

Temas del curso (I)

  • I. Introducción (a R, RStudio y R Markdown)

  • II. Manejo de bases de datos

Temas del curso (II)

  • III. Visualización de datos
Promedio de esperanza de vida por continente, 2007. Fuente: [Healy, 2018](http://socviz.co/lookatdata.html#what-makes-bad-figures-bad)

Promedio de esperanza de vida por continente, 2007. Fuente: Healy, 2018

Temas del curso (III)

  • IV. BĆŗsqueda efectiva de ayuda

  • V. Manejo avanzado de bases de datos

  • VI. AnĆ”lisis de texto

  • VII. R avanzado: tipos de objeto, funciones, iteraciones

Temas del curso (IV)

  • VIII. MinerĆ­a de datos
Relación de palabras para 100 tweets de S. Piñera y M. Bachelet. Fuente: [`@AlcratruzDaniel`, 2018](https://twitter.com/AlcatruzDaniel/status/1029946262899052544)

Relación de palabras para 100 tweets de S. Piñera y M. Bachelet. Fuente: @AlcratruzDaniel, 2018

Temas del curso (V)

  • IX. Datos espaciales y mapas
Trayectoria de emisiones per capita en la OCDE, 1997-2011. Elaboración propia.

Trayectoria de emisiones per capita en la OCDE, 1997-2011. Elaboración propia.

Temas del curso (VI)

  • X. EstadĆ­stica inferencial con R

  • XI. Replicación y generación de reportes

MetodologĆ­a de trabajo

  • Clases con enfoque prĆ”ctico (dos por semana). Requisito de asistencia: 70%.
  • Dos tipos de material: mĆ­nimo y ā€œtorpedosā€ (complementario).
  • AyudantĆ­as desde la próxima semana
  • Dudas por correo o plataforma.
  • Horas de oficina

Evaluaciones

  • Tres tareas individuales (20% c/u). I: L 16/09, II: L 14/10, L 11/11.
  • Participación en clases (5%) y ayudantĆ­as (5%).
  • Proyecto final en parejas.
    • Presentación flash (10%). L. 18/11 y W 20/11
    • Informe final (20%). L 02/12
  • Ausencia a evaluaciones, tiempo de corrección, recorrección.

Otros temas importantes

RStudio Cloud

Encuesta de cierre